Preparació de les dades per a l’anàlisi

El fitxer de dades amb informació de l’estat WGD (Bielski) conté 824 casos de la cohort de BRCA.

Tenim 1222 fitxers de recomptes de la cohort de BRCA.

L’anàlisi inclourà 819 mostres, 489 mostres sense WGD i 330 mostres amb WGD. Un 40% de les mostres de l’anàlisi han patit WGD.

La mida de les llibreries varia entre 2.248947610^{7} i 1.201251810^{8} i la mida mitjana és de 6.33287110^{7}.

Pre-processament de les dades

Per a la filtració s’ha utilitzat un llindar de CPM de 0.16 i s’han filtrat 38042 gens, és a dir un 63% dels gens que teníem inicialment.

El rang de valors dels factors de normalització és de 0.5945125, 1.3537472.

Exploració de les dades

Gràfics de densitat

Gràfic d’escalat multidimensional

Heatmap del gens més variables

Matriu de distàncies dels logCPM dels gens més variables. En aquest cas extraiem els 500 gens més variables a partir de les dades filtrades i normalitzades.

Resultats de l’anàlisi d’expressió diferencial

Nombre de gens diferencialment expressats

Contrastos amb p-valor ajustat (FDR) inferior a 0.05:

##        WGDvsNoWGD
## Down         6905
## NotSig       9720
## Up           5816

Contrastos amb p-valor sense ajustar inferior a 0.05 i valor absolut de log2-fold-change superior a 0.5 , aproximadament equivalent a un fold-change de 0.7 i 1.4:

##        WGDvsNoWGD
## Down         1699
## NotSig      19885
## Up            857

Llista de gens ordenats per significació

##       ensembl_gene_id hgnc_symbol     logFC      P.Value    adj.P.Val
## 2287  ENSG00000101003       GINS1 0.9420553 1.379273e-41 3.095226e-37
## 1658  ENSG00000087586       AURKA 1.0811100 7.502525e-39 5.612139e-35
## 2294  ENSG00000101057       MYBL2 1.5311736 5.180482e-39 5.612139e-35
## 12802 ENSG00000178999       AURKB 1.2221182 1.613066e-38 9.049706e-35
## 8076  ENSG00000146410       MTFR2 1.0639432 9.592317e-38 4.305224e-34
## 10703 ENSG00000166451       CENPN 0.8775259 2.317539e-37 8.667982e-34
## 10785 ENSG00000166851        PLK1 1.1113085 8.062812e-37 2.584822e-33
## 12256 ENSG00000175063       UBE2C 1.2741893 2.190053e-36 6.143373e-33
## 2383  ENSG00000101447      FAM83D 1.2534777 7.864397e-36 1.960944e-32
## 5839  ENSG00000130826        DKC1 0.5275788 1.303069e-35 2.924216e-32
## 1674  ENSG00000088305      DNMT3B 0.9120680 3.135862e-35 6.397443e-32
## 1676  ENSG00000088325        TPX2 1.0896818 8.008980e-35 1.497746e-31
## 1835  ENSG00000091651        ORC6 1.1058380 1.614524e-34 2.787040e-31
## 2588  ENSG00000103121        CMC2 0.6048545 3.520427e-34 5.642994e-31
## 12159 ENSG00000174371        EXO1 1.1070410 4.368391e-33 6.535405e-30
## 1296  ENSG00000077152       UBE2T 0.9100236 4.541908e-32 6.370310e-29
## 6763  ENSG00000136982       DSCC1 0.8901329 6.346909e-32 8.378293e-29
## 7635  ENSG00000143228        NUF2 1.0460512 1.562033e-31 1.947421e-28
## 5407  ENSG00000126953      TIMM8A 0.5039449 2.323921e-31 2.607555e-28
## 6489  ENSG00000135451       TROAP 1.0487456 2.259871e-31 2.607555e-28

Representació gràfica dels resultats

Gràfic mitjana-diferència

Gràfic de volcà

Heatmap dels gens més significatius

100 gens amb p-valor ajustat més baix:

100 gens amb p-valor ajustat més baix després d’haver filtrat per aquells gens amb un logFC en valor absolut superior a 0.5 (aproximadament equivalent a FC superior a 1.4 o inferior a 0.7):

Resultats de l’anàlisi d’enriquiment amb permutació de gene sets

Termes enriquits al grup WGD
NAME FDR.q.val NES
GO_SISTER_CHROMATID_SEGREGATION 0 3.370897
GO_MITOTIC_SISTER_CHROMATID_SEGREGATION 0 3.243567
GO_DNA_DEPENDENT_DNA_REPLICATION 0 3.230720
GO_CHROMOSOME_SEGREGATION 0 3.230175
GO_NUCLEAR_CHROMOSOME_SEGREGATION 0 3.200197
GO_MITOTIC_NUCLEAR_DIVISION 0 3.195787
GO_REGULATION_OF_CHROMOSOME_SEGREGATION 0 3.105019
GO_DNA_REPLICATION 0 3.033211
GO_REGULATION_OF_SISTER_CHROMATID_SEGREGATION 0 3.012116
GO_DNA_CONFORMATION_CHANGE 0 2.991282
GO_ORGANELLE_FISSION 0 2.943186
GO_MICROTUBULE_CYTOSKELETON_ORGANIZATION_INVOLVED_IN_MITOSIS 0 2.942741
GO_SPINDLE_ORGANIZATION 0 2.936177
GO_MITOTIC_SPINDLE_ORGANIZATION 0 2.935978
GO_METAPHASE_ANAPHASE_TRANSITION_OF_CELL_CYCLE 0 2.929472
GO_DNA_GEOMETRIC_CHANGE 0 2.915489
GO_CELL_CYCLE_DNA_REPLICATION 0 2.899850
GO_DNA_PACKAGING 0 2.898234
GO_MEIOTIC_CELL_CYCLE_PROCESS 0 2.850250
GO_REGULATION_OF_CHROMOSOME_SEPARATION 0 2.845407
Termes enriquits al grup no_WGD
NAME FDR.q.val NES
GO_MEMBRANE_DEPOLARIZATION_DURING_ACTION_POTENTIAL 0.0009523 -2.308334
GO_MULTICELLULAR_ORGANISMAL_SIGNALING 0.0004762 -2.297990
GO_AXONEME_ASSEMBLY 0.0006435 -2.264445
GO_ACTION_POTENTIAL 0.0016914 -2.213507
GO_CARDIAC_CONDUCTION 0.0032955 -2.152883
GO_TRANSMISSION_OF_NERVE_IMPULSE 0.0045356 -2.123252
GO_MEMBRANE_DEPOLARIZATION_DURING_CARDIAC_MUSCLE_CELL_ACTION_POTENTIAL 0.0041661 -2.120354
GO_REGULATION_OF_HEART_RATE_BY_CARDIAC_CONDUCTION 0.0036453 -2.117909
GO_CARDIAC_MUSCLE_CELL_CONTRACTION 0.0052909 -2.088472
GO_CELL_COMMUNICATION_INVOLVED_IN_CARDIAC_CONDUCTION 0.0048579 -2.086827
GO_CARDIAC_MUSCLE_CELL_ACTION_POTENTIAL 0.0050307 -2.075831
GO_REGULATION_OF_HEART_RATE 0.0050177 -2.065465
GO_SODIUM_ION_HOMEOSTASIS 0.0051563 -2.059320
GO_NEGATIVE_REGULATION_OF_VASCULATURE_DEVELOPMENT 0.0052032 -2.056038
GO_CARDIAC_MUSCLE_CELL_ACTION_POTENTIAL_INVOLVED_IN_CONTRACTION 0.0048563 -2.055819
GO_AXONEMAL_DYNEIN_COMPLEX_ASSEMBLY 0.0050387 -2.045437
GO_RENAL_SYSTEM_PROCESS 0.0050273 -2.042260
GO_CILIUM_MOVEMENT 0.0058820 -2.033903
GO_MEMBRANE_REPOLARIZATION 0.0065950 -2.025452
GO_CELL_CELL_SIGNALING_INVOLVED_IN_CARDIAC_CONDUCTION 0.0062653 -2.025301

Anàlisis d’immunitat

ESTIMATE

Immunophenoscore

Signatura 12-Chemokines